El problema: Clusterizar diseños

¿Como hago para clasificar estilos de banners?

Input data

Se sacan metadatos de un archivo de photoshop

Estrategia 1:

library(umap)
library(dbscan)
umap_data<- umap(data)
cl <-hdbscan(x = umap_data, minPts = 3)

Validacion

En terminos de negocio…¿sirve hacer esto?

Estrategia 2

Surge la necesidad de transformar los datos

Opciones

¿Puedo usar estas transformaciones en estos datos?

  • No, como las variables describen dimensiones (alto y ancho), y posicion en el espacio no le encontré mucho sentido a la estandarizacion ni la normalizacion.

  • ¿Que podría hacer? En lugar de ver las posiciones y dimensiones absolutas, ver las posiciones y dimensiones relativas, lo que voy a llamar “normalizacion geometrica”

Normalizacion “geometrica”

mi nueva variable x’ es: la linea roja dividida la linea azul

Normalizacion “geometrica”

mi nueva variable y’ es: la linea roja dividida la linea azul

Normalizacion “geometrica”

mi nueva variable areaRelativa es: el area del cuadrado chiquito dividido la del rectangulo grande

Normalizacion “geometrica”

mi nueva variable disposicion es: el alto dividido por el ancho

Resultados